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Beoordelen “ei net oog op 
de toekomst 


Dominique Sluijsmans 


Studenten ervaren beoordelen vooral als een sluit- 


stuk van het onderwijs. Vanuit de gedachte ‘de vol- 


doende is binnen, dus het leren is klaar’ zal beoorde- 


len slechts een korte termijn effect op leren hebben 


en is er nauwelijks sprake van beklijving van kennis 


en kunde. Deze summatieve functie van beoorde- 


len is niet meer toereikend gezien de hedendaagse 


ontwikkelingen zoals een leven lang leren. In deze 


bijdrage worden tien kenmerken van beoordelen 


benoemd die gericht zijn op duurzaam leren. 
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Inleiding 

Tot op de dag van vandaag heeft beoordelen in de 

ogen van studenten een afrekenende, selecterende of 
certificerende rol. Deze summatieve functie is gezien de 
complexiteit en heterogeniteit van onderwijsdoelen en 
arbeidscontexten niet meer toereikend om op een valide 
en betrouwbare wijze te bepalen hoe en wat studenten 
geleerd hebben en wat het effect van het geleerde is op 
de lange termijn. Het onderwijs zal zich meer moeten 
richten op een holistisch ontwerp van onderwijs waarin 
instructie, leren en beoordelen een coherent geheel vor- 
men (Sluijsmans, 2008). Daarbij wordt het belangrijker de 
lerende te voorzien van rijke informatie die verder leren 
voedt, de zogenaamde formatieve functie. Naast de sum- 
matieve en formatieve functie kan een derde functie van 
beoordelen worden benoemd die gericht is op de indi 
viduele ontwikkeling van de student met het oog op zijn 
of haar toekomst. Dit zogenaamde duurzaam beoorde- 
len hangt zeer nauw samen met het leerproces en geeft 


de student een hoge mate van verantwoordelijkheid. Wat 
precies met duurzaam beoordelen wordt bedoeld, wordt 
met de volgende tien kenmerken verduidelijkt, 


Kenmerken van duurzaam 

beoordelen 

Kenmerk 1. De unieke student staat centraal 

Huidige wijzen van beoordelen sluiten nog weinig 

aan bij de ontwikkeling van de individuele student. Zo 
worden prestaties van studenten in het‘normgerichte 
beoordelingsmodel‘ afgezet tegen de gemiddelde 
prestatie van de groep. Zit je bijvoorbeeld als laag 
presterende student in een hoog presterende groep, dan 
is de kans op een voldoende klein. In het/criteriumge- 
richte beoordelingsmodel’ worden prestaties niet zozeer 
vergeleken met de normprestatie van de groep, maar 
worden studenten beoordeeld op grond van een aantal 
beoordelingscriteria en standaarden. Resultaat van crite- 
riumgerichte beoordelingen is dat sommige studenten 
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Duurzaam beoordelen geeft de student 


een hoge mate van verantwoordelijkheid 


de vastgestelde standaarden op de criteria bereiken en 
andere studenten niet of met moeite. 

In zowel het normgerichte als criteriumgerichte be- 
oordelingsmodel schuilt het gevaar van het bekende 
toetsgedrag (wash-back effect; Alderson & Wall, 1993). 
De boeken en het portfolio verdwijnen in de kast als de 
voldoende binnen is. De individuele student met zijn 
unieke profiel verdwijnt volledig in een groepsgemid- 
delde of wordt slechts summatief afgevinkt op een lijst 
van beoordelingscriteria die niet op het niveau van de in- 
dividuele student zijn afgestemd. Bij duurzaam beoorde- 
en is de beoordeling afgestemd op de‘zone van naaste 
ontwikkeling'van de unieke student, om verder leren 
mogelijk te maken. Dit betekent dat studenten niet meer 
op hetzelfde moment met dezelfde beoordelingscriteria 
en op hetzelfde niveau aan de slag gaan. 
Een beoordelingsmodel dat hierbij past is het ipsatief 
beoordelingsmodel (ipse'is Latijn voor zelf"), waarbij 
beoordelingen van studenten, die zijn aangepast aan 
het niveau van de student, worden vergeleken in de 
tijd. Met andere woorden, de prestatie van de student 


Er is sprake van duurzaam beoordelen omdat criteria 

en standaarden flexibel kunnen worden aangepast 

en de beoordelingen zich niet meer beperken tot een 
momentopname maar continu plaatsvinden. Uiteraard 
blijven de criteria en standaarden essentieel om de kwa- 
iteit te kunnen borgen. Wanneer de afstand tussen de 
ontwikkeling van de student te groot wordt ten opzichte 
van de minimale standaarden, kan tijdig worden bezien 
of bijvoorbeeld moet worden gekozen voor een andere 
standaard c.q. andere opleiding. 


Kenmerk 2. Het accent ligt op leren voor de toekomst 
In het huidige onderwijs heeft het beoordelen vooral 
betrekking op uitspraken over hoe de studenten in 
het verleden hebben gepresteerd en presteren op het 
moment van toetsafname. 
Een tweede kenmerk van duurzaam beoordelen is dat 
de beoordeling informatie verschaft over de groei die is 
doorgemaakt ten aanzien van het vorige toetsmoment 
en tot welk nieuw leerdoel deze leidt. Dit betekent dat 
beoordelen niet langer het sluitstuk van het onderwijs is, 
maar steeds fungeert als een startpunt van een nieuwe 
leerfase. 
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wordt steeds vergeleken met zijn of haar eigen prestaties. 


Kenmerk 3. Betekenisvolle beoordelingstaken 

In het huidige onderwijs bestaat een gebrekkige 
aansluiting tussen leren en beoordelen die onder 

andere zichtbaar is in de ontwrichte verhouding tussen 
‘onderwijstijd’en ‘beoordelingstijd!Voorbeelden zijn de 
geclusterde proefwerkweken, (her)jtentamens en de half- 
jaarlijkse portfoliobeoordelingen. Zolang onderwijstijd en 
beoordelingstijd zwak zijn geïntegreerd, zullen studenten 
zich vooral inspannen in de periodes vlak voor de beoor- 
deling met het bekende uitstelgedrag als gevolg. Juist 
voor complexere kennisgebieden en vaardigheden is het 
cruciaal de relevante beoordelingscriteria en standaarden 
optimaal te integreren. 
Een derde kenmerk van duurzaam beoordelen zijn be- 
tekenisvolle beoordelingstaken. In deze beoordelingsta- 
ken - die kunnen worden geschaard onder de noemer 
‘onderwijs’- worden leren en beoordelen geïntegreerd, 
omdat ze studenten aanzetten tot het werken aan ge- 
dragsdoelen die gericht zijn op het beklijven van kennis, 
vaardigheden en houdingen. Beoordelingstaken kunnen 
de student in vele vormen worden aangeboden, zoals 
opdrachten, situaties, problemen of projecten. Beoorde- 
ling- en onderwijstijd zijn door de integratie volledig in 
balans. 


Kenmerk 4. Zelfsturing wordt gestimuleerd 
Zelfsturing wordt als een essentiële vaardigheid be- 
schouwd om leren voor de lange termijn mogelijk te 
maken. Zelfsturing veronderstelt dat studenten kunnen 
plannen en zichzelf (en anderen) beoordelen. Er is echter 
nog maar weinig empirisch bewijs dat studenten in 
staat zijn hun leervraag goed te definiëren en zichzelf 
te beoordelen. Zelfsturing is moeilijk. Onderzoek wijst 
uit dat studenten hun kennen en kunnen overschatten 
door een gebrek aan kennis over de beoordelingscriteria 
Krueger & Dunning, 1999). 
Het (leren) vormgeven aan het eigen leren is een vierde 
enmerk van duurzaam beoordelen. Voor studenten 
betekent dit dat zij niet langer meer achteroverleunend 
het onderwijs consumeren, maar dat zij zich veel meer 
opstellen als ‘prosumers; proactieve gebruikers die mede 
vormgeven aan het beoordelen door op eigen initiatief 
feedback te zoeken (Martens, 2007). Om zelfsturing te 
bevorderen zal in het ontwerp van beoordelingstaken 
ook het leren plannen (selecteren van doelen en taken) 
en het leren (zelf)beoordelen van belang worden. De 
ondersteuning die de student wordt geboden beperkt 


E 
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Huidige vormen van beoordelen 


hebben dikwijls een korte termijn effect op leren 


zich niet tot de beoordelingstaak, maar strekt zich uit tot 
leren plannen en beoordelen. 


Kenmerk 5. De lerende voelt zich eigenaar van de 
beoordeling 

Huidige beoordelingsmethoden zijn overwegend 
prescriptief van aard. Omdat de opleiding en de docent 
bepalen wat, hoe en wanneer wordt beoordeeld, hebben 
zij nog steeds de volledige controle over het onderwijs- 
eerproces van de student. Omdat de student nauwelijks 
betrokken wordt bij de voorbereiding en uitvoering van 
de beoordeling, zal het effect van de beoordeling op 
ange termijn leren minimaal zijn. De laatste jaren zijn veel 
initiatieven genomen om studenten meer te betrekken 
bij beoordelen, zoals zelf- peer- en portfoliobeoorde- 
ingen. Maar ook hier gaat het vooral om vormen van 
beoordelen die de student worden opgelegd. Zo wordt 
per docent vastgelegd wanneer de reflectierapporten 
of het portfolio moeten worden geschreven, in hoeveel 
woorden en volgens welke structuur. Het invoeren van 
zelfbeoordeling op deze manier demotiveert studenten 
eerder en leidt tot ‘reflectie-moeheid: Reflecteren wordt 
een routine en studenten schrijven op wat de docent 
graag in het reflectieverslag terug wil zien. Het geven van 
controle aan studenten over de wijze waarop ze worden 
beoordeeld, wanneer ze worden beoordeeld en doo 
wie ze worden beoordeeld, kan leiden tot een actievere 
betrokkenheid van studenten. 

Het creëren van eigenaarschap is een vijfde kenmerk van 
duurzaam beoordelen. Dit kan vervolgens tot een ho- 
gere motivatie en tot meer leren leiden dan wanneer het 
beoordelen extern wordt aangestuurd. Dit perspectief 
sluit goed aan bij motivatietheorieën, zoals de zelfdeter- 
minatie-theorie'‘ (Ryan & Deci, 2000), waarin competentie, 
autonomie en sociale verbondenheid de basisbehoeften 
zijn. Studenten kunnen bijvoorbeeld zelf kiezen op welke 
criteria en standaarden ze worden beoordeeld. 


H 


Kenmerk 6. De mate van duurzaamheid van kennis 
wordt erkend 

Gezien de opkomende kenniseconomie is het van 
belang dat studenten leren nieuwe kennis te construe- 
ren en deze kennis adequaat toe te passen in situaties. 
Recente ontwikkelingen zoals het vaststellen van diverse 
canons en de wens vanuit het ministerie voor een krach- 
tige kennisbasis voor diverse beroepende tonen aan dat 
kennis cruciaal is. 
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Een zesde kenmerk van duurzaam beoordelen is dat de 

duurzaamheid van kennis wordt erkend. Hiermee wordt 
bedoeld dat de waarde van kennis voor de lange termijn 
wordt vastgesteld. 


Kenmerk 7. Beoordelen is start van een nieuwe 
leercyclus 

Doordat veel beoordelingen worden afgesloten met een 
voldoende of een cijfer, wordt een soort‘eindigheid’in 
eren gesuggereerd. In het normgerichte beoordelings- 
model is er bijvoorbeeld voor diegenen die het beste zijn 
n hun groep geen reden om verder te leren als de norm 
is behaald. Ook in het criteriumgerichte beoordelings- 
model is er geen reden om verder te leren als de criteria 
en standaarden zijn behaald. In het ipsatief beoordelings- 
model zoals beschreven bij het eerste kenmerk, zal de 
erende niet alleen informatie zoeken en krijgen over zijn 
prestaties van nu, maar zal vooral worden geïnvesteerd in 
het bieden van handvatten voor de volgende stap in het 
eerproces. 
Een zevende kenmerk van duurzaam beoordelen is dat 
beoordelen niet het sluitstuk van leren is, maar vooral de 
functie heeft een nieuwe leercyclus op te starten. 


Kenmerk 8. Heldere criteria en standaarden 
Helder geformuleerde beoordelingscriteria en standaar- 
den vormen nog te weinig de basis in het onderwijs. Ze 
worden meestal per vak door de individuele docent be- 
paald, vaak op een moment dat het onderwijs al‘achter 
de rug is'en er nog een beoordeling moet plaatsvinden. 
De beoordelingscriteria en standaarden zitten daarbij 
vooral in het hoofd van de docent (tacit knowledge; 
Sadler, 1989), waardoor de student niet kan begrijpen 
waaraan moet worden voldaan en zich dus ook niet 
adequaat kan voorbereiden. Uit onderzoek blijkt dat 
studenten nogal eens verrast worden door de inhoud 
van een beoordeling, omdat de verwachtingen van de 
student over de beoordelingscriteria niet overeenkomen 
met de verwachtingen van de docent Broekkamp & van 
out-Wolters, 2007). Naast heldere beoordelingscriteria 
zijn ook heldere standaarden (niveau') nodig. Wat betreft 
de standaarden is er niet altijd helderheid, blijkend uit 
eacties van studenten als'De toets was veel te moeilijk! 
elderheid over beoordelingscriteria en standaarden is 
het achtste kenmerk van duurzaam beoordelen. Hiervoor 
is het van belang zogenaamde gedragsdoelen te definie- 
en. Gedragsdoelen worden afgeleid van de gewenste 
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Duurzaam beoordelen 
past bij een leven lang leren 


vaardigheden in een beroep of bepaald kennisdomein. 
Goed gedefinieerde gedragsdoelen beschrijven de 
condities waaronder kennis en kunde moeten worden 
gedemonstreerd, en de beoordelingscriteria en stan- 
daarden. De condities waaronder de student een taak 
uitvoert bepalen in veel gevallen de standaard van een 
criterium. Vervolgens is een groot aantal beoordelingen 
met duidelijke beoordelingscriteria en standaarden als 
basis essentieel. Alleen dan kunnen resultaten op deze 
taken met elkaar worden vergeleken en is het ontwerp 
van een ipsatief beoordelingsmodel (zie eerste kenmerk) 
mogelijk. 


Kenmerk 9. De resultaten van beoordelingen zijn 
informatierijk 

Over de feilbaarheid van de menselijke beoordelaar is 
al veel gepubliceerd (zie bijvoorbeeld De Groot, 1966). 
Vele studies hebben aangetoond dat docenten met 
vergelijkbare deskundigheden dezelfde taak verschillend 
beoordelen. Tot op heden is het gebrek aan overeen- 
stemming tussen beoordelaars een heikel punt. In het 
bijzonder als het gaat om certificerende beslissingen 
wordt de mens als beoordelaar in twijfel getrokken. 
edere docent hanteert zo zijn eigen‘beoordelingsregels’ 
en -strategieën; maar expliciteert deze helaas niet of 
nauwelijks. In beoordelingen wordt de aanvankelijk rijke 
informatie van beoordelaars vaak teruggefilterd tot een 
saai, simpel, nietszeggend cijfer, de student nauwelijks 
motiverend tot verder leren (Schuwirth, 2007). Ook wordt 
het cijfer op een moment verstrekt dat de student de be- 
oordelingstaak nog maar nauwelijks voor de geest weet 
te halen. Niet alleen de beoordelingscriteria waren bij 

het verstrekken van de opdracht onvoldoende specifiek 
gecommuniceerd, ook is lang niet altijd sprake van spe- 
cifieke en constructieve feedback. Hoewel onderzoek al 
meerdere malen heeft aangetoond dat cijfers de meest 
zwakke vorm van feedback zijn, zien we deze nog veel in 
het onderwijs. Omdat het becijferen zich vooral richt op 
het vaststellen van een prestatie op een bepaald tijdstip, 
zijn beoordelingen per definitie summatief. Beoordelin- 
gen die nu vaak als formatief worden bestempeld krijgen 
die benaming vooral als het cijfer ‘niet meetelt: Zolang 
echter informatie ontbreekt over de betekenis van de 
beoordeling en het toekomstig leertraject dat de student 
zal doorlopen is er geen sprake van duurzaam beoorde- 
len. 
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Een negende kenmerk van duurzaam beoordelen is de 
informatierijkheid van beoordelingen. Docenten explici- 
teren hun beoordelingsaanpak naar studenten, zodat zij 
beter begrijpen waarop en hoe zij worden beoordeeld. 
De communicatie in duurzaam beoordelen betekent 
dat niet alleen het resultaat van een beoordeling wordt 
gecommuniceerd (voldoende, cijfer, geslaagd, goed 
gedaan), maar dat deze communicatie de student hand- 
vaten biedt voor verdere ontwikkeling. Het benadrukken 
van de individuele vooruitgang bevordert niet alleen het 
geloof in eigen kunnen, maar reduceert ook de neiging 
zichzelf continu te vergelijken met medestudenten. 


Kenmerk 10. In de beoordeling wordt informeel en non- 
formeel leren erkend 

Het laatste maar zeker niet minst belangrijke kenmerk 
van duurzaam beoordelen is dat in de beoordeling ook 
de informele en non-formele leeromgeving van de 
student wordt erkend. Was het tot nu toe zo dat alleen 
formeel leren werd beoordeeld, het is relevant te kijken 
naar andere leerervaringen van studenten die kunnen 
bijdragen aan een goede beoordeling van kennis en 
unde (Joosten-ten Brinke, Sluijsmans, Brand-Gruwel & 
Jochems, 2008). Ook kan de wijze waarop studenten 
eren relevant zijn om te bepalen waarom zij op een be- 
paalde manier presteren. Tot nu toe wordt informeel en 
non-formeel leren erkend bij procedures voor het erken- 
nen van eerder of elders verworven competenties (EVC). 
Gezien het belang van continuïteit in beoordelen (zie het 
derde kenmerk), is het betrekken van leer- en leefwereld 
van de student doorlopend van belang. 


What's new? 

Een terechte vraag is wat duurzaam beoordelen 
toevoegt aan bestaande concepten als formatief of 
ontwikkelingsgericht beoordelen. Onderzoek naar de 
racht van formatieve beoordelingen (Black & Wiliam, 
1998) heeft al bewezen dat deze wijze van beoordelen 
het leren bevordert. Al in 2002 heeft de Assessment 
Reform Group (ARG) principes voor het veranderen van 
de beoordelingspraktijk in de klas geformuleerd. Hoewel 
deze principes overeenkomsten vertonen met de ken- 
merken zoals uiteengezet in deze bijdrage (bijvoorbeeld 
het belang van heldere criteria en oog voor motivatie), 
schieten zij nog tekort als het gaat om het ontwerp van 
beoordelingstaken, de effecten van beoordelen op de 
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Bij duurzaam beoordelen 
wordt de waarde van kennis 


voor de lange termijn vastgesteld 


ange termijn, het belang van non- en informeel leren, de 
informatierijkheid van beoordelingen, de communicatie 
over beoordelen en de continuïteit van beoordelen. 
Wanneer onderwijsgevenden de huidige beoordelings- 
methoden onder de loep nemen blijken deze vaak nog 
onvoldoende duurzaam ontworpen: beoordelingen zijn 
informatiearm door het cijfersysteem, de inhoudsvalidi- 
teit is laag, lerenden worden nauwelijks betrokken bij de 
beoordeling en de leereffecten van beoordelen worden 
te weinig onderkend en onderzocht. De ontwikkeling 
van een duurzame beoordelingsvisie die past bij huidige 
en toekomstige ontwikkelingen, zal voor alle niveaus en 
in alle sectoren van onderwijs cruciaal worden, maar staat 
op dit moment nog in de kinderschoenen. 


Afsluitend 

Samenvattend kunnen drie pijlers worden benoemd 
waarop duurzaam beoordelen rust: 
1) een goed ontwerp van onderwijs waarbij leren en 
beoordelen samensmelten, 
2) een heldere communicatie met studenten en col- 
ega's over het waarom, wat en hoe van beoordelen en 

3) het stimuleren van een zelfsturende houding. 

Uit de tien beschreven kenmerken is te herleiden dat 
duurzaam beoordelen van studenten en docenten een 
blik over de grenzen van het diploma heen vraagt. Het 
eren houdt immers niet op na een opleiding. Studenten 
zullen moeten leren hoe ze blijven leren, simpelweg om- 
dat de kenniseconomie dat van ze vraagt. De praktijk van 
alledag maakt het zeer lastig om op individueel niveau 
studenten informatie te verschaffen over hun kennen en 
kunnen, op een manier die ook nog eens past bij hun 
leervraag en persoonlijkheid. Omdat deze flexibilisering 


ook vanuit logistiek 
vragen, zal beoorde! 
te realiseren zijn op 


voorspellen wanneer duurzaam beoordelen vruchten 


en bij vraaggestuurd leren moeil 
orte termijn. Dit maakt het lastig 


perspectief veel van het onderwijs zal 


ijk 
e 


zal afwerpen. Voor nu is een eerste waardevolle stap om 
onderwijsgevenden naar hun visie op beoordelen te 


vragen:Waarom wil je beoordelen en op welke manier 
zou je dat graag willen vormgeven? Door deze vraag 
het debat over beoordelen komt 
vaak (het gebrek aan) de aansluiting tussen onderwij 
en beoordelen naar de oppervlakte. Het ‘waarom’ van 
beoordelen is echter voorwaardelijk voor het‘wat'en 


centraal te stellen in 


om tot structureel a 
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ndere beelden over beoordelen i 


S 


het onderwijs te komen. Bewustwording van de huidige 
beoordelingspraktijk is de eerste essentiële stap naar 
structurele verandering. 
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